XML Sitemap
新規ページ、下層ページをGooglebotに存在を伝えるために使う
重要であると判断したページを Google に推奨するためのファイル
sitemapに含まれるすべての URLのクロールされると確約されているものではない
以下のようなケースで有用
サイトが新しく、外部からのリンクが少ない
サイトのページ数が非常に多い
サイトにどこからもリンクされていないページが存在する
例
code:xml
<?xml version="1.0" encoding="UTF-8"?>
<url>
<lastmod>2018-06-04</lastmod>
</url>
<url>
<lastmod>2018-06-05</lastmod>
</url>
..
</urlset>
loc
必須
ページのURL
絶対path
2048文字以下
lastmod
ファイルの最終更新日
以下の形式で書く
2022-06-30T21:10+09:00
2007-06-30
changefreq
更新頻度
always, hourly, daily, weekly, monthly, yearly, never
crawlerが巡回する目安にするらしい
priority
相対値
全部大きくしても意味ない
sitemapの仕様としては存在するが、実際は使われていないので書く必要ない
参考
Googleは、サイトをクロールするたびにsitemapを確認するわけではない
サイトマップの確認は最初に通知されたときのみ
その後は変更が Google に通知された場合にのみ確認される
以下の場合にのみGoogleにsitemapについて通知する
sitemapが新規作成された場合
更新された場合
lastmodを更新すればいい
未変更のsitemapについて、送信や通知を複数回行わないようにする
サイトマップ内のページを更新した場合は、<lastmod> フィールドでマークしてください。ref どこに設置する?
domain内の任意の場所に置き、以下をおこなる
Search Consoleでテストと送信
xml sitemapの形式が正しいか確認できる
サイズ制限
以下を超える場合は分割する
記載URL数が50,000個
ファイルサイズが50MB
どうやって作る?
どれぐらいの頻度で更新すべき?
非正規ページやnoindexページは記載しなくていい
/posts/12とか連番で適当に生成するのってよろしくないよね?
例えば/posts/200は削除済みかもしれない